#Lepton AI
輝達收購LeptonAI對中國的啟示
3月26日,矽谷知名媒體揭露輝達即將以數億美元收購矽谷新創公司Lepton AI,引發AI產業震動。近年來,輝達主要客戶透過自研晶片和低價租賃策略不斷削弱其GPU市場壟斷地位,由此輝達通過投資佈局,持續補強其在軟件生態和應用落地的短板,實現從“硬體壟斷”向“硬體+軟件+應用全棧服務商”的生態佈局。本次收購Lepton AI正是輝達加碼雲和軟件領域佈局的戰略之舉,對中國AI基礎領域建設有重要啟示。01. 輝達收購Lepton AI事件分析數據中心業務是輝達核心成長引擎,2024財年貢獻78%營收(475億美元)。與此同時,輝達的主要客戶1微軟、亞馬遜和Google等加速自研晶片並提供低價算力租賃服務,對其持續成長構成威脅。為此,輝達正謀求從「賣鏟人」轉型為「全端服務商」。Lepton AI是一家提供GPU雲服務的AI初創公司,具備三方面優勢吸引輝達對其投資:一是輕量化資源調度。 Lepton AI 2的雲原生工具鏈FastGPU透過多雲整合技術與彈性調度演算法,協助客戶優化算力使用效率,降低算力成本,綜合費用約為亞馬遜等頭部企業的60-70% 3。二是低程式碼開發範式。 Lepton Search僅以500行程式碼實現對話式搜尋引擎,開源後迅速登上GitHub熱榜,其「極簡開發」理念降低開發者使用門檻,吸引更多「長尾客戶」。三是頂尖技術團隊。 Lepton AI創始人賈揚清是深度學習框架領域的標竿人物,曾主導開發PyTorch、Caffe等深度學習框架,團隊還集結了神經網絡交換標準ONNX的聯合創始人等頂尖人才,技術能力覆蓋AI框架、分佈式系統、雲原生工具鍊等關鍵領域。02. 輝達近兩年投資特點近兩年輝達投資活躍,共投資92次,投資密度遠超微軟和亞馬遜4。根據IT橘子和金融時報資料,2024年輝達投資規模突破10億美元,年增15%。同時,輝達加大收購力度,2024年共完成6起收購,超過前四年總和。輝達投資主體呈現「三駕馬車」架構:NVIDIA主導戰略投資與收購,重點補強AI軟件工具鏈;NVentures專注先進製造、生物醫療等垂直領域風險投資;Inception負責對初創企業開展孵化項目,通過硬體折扣、技術賦能構建開發者生態。總體而言,輝達近兩年投資呈現「生態佈局-技術創新-戰略聯盟」的三維特徵。1.生態佈局,建構「硬體+軟體+應用」的全鏈體系。一是AI基礎設施強化。 2024年收購Run:ai(資源調度)、Deci(模型優化)、OctoAI(推理服務)、Brev.dev(開發工具)、Shoreline(故障處理)五家企業,完善數據中心從算力分配到模型部署的全流程工具鏈,形成AI基礎設施生態閉環,本次收購Lepton AIpton AIpton 軟件的持續加碼。二是垂直場景滲透。輝達集中投資智慧製造、生物醫療兩大場景,投資企業數分別佔15%,自動駕駛場景也有涉獵,佔比4%。如投資金屬3D印刷Seurat Technologies,搶佔綠色製造賽道;收購AI醫療公司VinBrain,優化AI影像模型開發;參與自動駕駛Wayve融資,加速建構高精度虛擬測試環境。2.技術創新,佈局前沿領域搶佔下一代AI技術制高點。一是空間智慧領域,佈局圖形計算、虛擬模擬和空間感知技術。 2024年投資World Labs,專注世界模型(LWM)開發,將AI從2D影像處理提升至3D空間智慧領域;投資Figure AI、Bright Machines、Serve Robotics等七家機器人公司,覆蓋通用人形機器人、製造、配送全場景。二是生命科學領域,佈局基因工程、生物製藥等交叉學科。投資ArsenalBio(基因編輯)、Generate Biomedicine(蛋白質生成)等七家公司,致力於AI技術加速基因測序和縮短藥物研發周期。三是量子和光子計算領域,佈局光傳輸和GPU超高速計算。設立加速量子研究中心NVAQC,聯合哈佛、MIT、Quantinuum等合作夥伴研發量子糾錯、演算法模擬與硬控制優化技術,突破傳統算力計算問題;投資Xscape Photonics,利用其ChromX光子解決方案破解超大規模GPU群聚互聯瓶頸。3.戰略聯盟,以資本為紐帶強化產業鏈掌控權。一是產品繫結,建構GPU應用壁壘。透過投資OpenAI、xAI、CoreWeave等企業,在合作協議中嵌入GPU使用條款,既保障產品銷售又透過資本紐帶強化客戶粘性,使輝達產品成為AI研發的「默認選項」。二是追加投資,鎖定產業話語權。如在AI搜尋賽道,一年內對Perplexity AI實施兩輪注資,推動其估值飆升9倍至90億美元,遠超行業平均水平,以較低成本實現對AI搜尋賽道的掌控。03. 本次收購事件的啟示1.建構自主可控的國產技術生態體系。一是加速建構自主開源技術生態,透過政策引導與市場激勵結合,推動昇騰、MindSpore等國產技術標準完善,提升國產技術應用比例,維持與國際主流標準相容互通,實現技術生態的平穩過渡。二是優勢場景突破,如在機器人、自動駕駛領域鼓勵發展國產高速互聯標準,取代輝達NVLink生態,推動晶片、框架、演算法與應用的縱向深度融合,在中國優勢場景中搶佔話語權。第三是持續加強國產高階AI晶片攻關,應對輝達下一代晶片架構Rubin(2026)和Feynman(2028),重點推進量子晶片研發,突破超高速、大規模平行計算瓶頸,提升高階晶片領域核心競爭力。2.推動算力建設從物理基建邁向精準使用。一是提升中國算力智能調度能力,在「東數西算」工程中進一步深化「軟體定義算力」的新範式,針對多叢集廣域網高效互聯、跨硬體異構管理等領域加強研發,提升使用效率。二是加速推動分散式算力網絡建設,探索基於國產晶片的算力聯盟,透過跨區域、跨企業協作建構自主可控的算力池,整合閒置算力資源,試點「算力銀行」模式,提高利用率。第三是加強AI應用工具開發,類似Lepton Search透過極簡程式碼生成AI應用,推動低程式碼工具鏈開發,並加強與國產硬體和軟件框架的協同優化,降低中小企業使用AI的技術門檻,推動算力使用。3.加強關鍵基礎技術攻關與商業轉化。一是鼓勵企業、大學、研究機構加強關鍵基礎技術科研,透過技術競賽、人才激勵等舉措,吸引高技術人才開展深度學習架構、AI編譯器等底層領域研發。二是加速研發成果轉化,完善針對技術型初創企業的扶持政策,如稅收減免、設立「AI框架專項基金」等,通過政策引導資本投向底層技術領域,重點支援關鍵基礎技術攻關項目,激勵底層技術研發。 (天翼智庫)
20人創業神話,老黃數億刀收購!AI大牛賈揚清、白俊傑被曝入職輝達
創立兩年的Lepton AI被輝達收入囊中!聯創AI大牛賈揚清和白俊傑,已經加入收購方輝達。這次收購將完善輝達的AI投資佈局。靴子落地,創立兩年的Lepton AI被輝達收入囊中!據The Information報導,輝達斥資數億美元,完成了對AI大牛賈揚清創企Lepton AI的收購。目前,Lepton AI的聯創賈揚清(下圖左)和白俊傑(下圖右),均已入職輝達。Lepton AI創立2年,團隊規模20人,AI制富神話可見一斑!Lepton AI:黃金級AI雲服務商Lepton AI成立於2023年,專注於人工智慧基礎設施(AI Infra),總部位於加州帕洛阿托,約有20名員工。2023年5月,該公司完成了1100萬美元的天使輪融資。其客戶包括擁有數十萬活躍使用者的AI遊戲公司Latitude.io以及科研平台SciSpace等。Lepton AI通過創新的「雲原生+多雲整合」技術,從雲提供商租用輝達GPU,再轉租給客戶。這一模式能以低成本在全球範圍內靈活調度GPU資源,滿足客戶的AI算力需求。Lepton AI還為客戶提供工具,方便他們訓練和運行AI模型,或者基於Python程式語言建構雲應用程式。旗下的Lepton AI Cloud平台專門針對AI工作負載進行了最佳化,提供多種顯示卡,配備可視化介面,讓使用者能管理每個項目分配到的硬體資源。Lepton AI能以每秒超過600個token的處理速度運算,同時將延遲控制在10毫秒以內。需求增加時,平台會自動為推理環境增加更多硬體資源,還會用vLLM等工具進一步提升推理速度。在SemiAnalysis的GPU雲端運算叢集評級中,LeptonAI獲得黃金級評價LeptonAI Python庫,能夠輕鬆地利用Python程式碼建構AI服務,目前在Github上有2.7K星。其主要功能包括:Python風格的抽象Photon,只需幾行程式碼即可將研究和建模程式碼轉換為服務。簡單的抽象,允許幾行程式碼就能啟動類似HuggingFace上的模型。為常見模型(如Llama、SDXL、Whisper等)提供了預建構的示例。提供專為AI定製的功能,如自動批處理、後台任務等。一個客戶端,能夠像呼叫本地Python函數一樣自動呼叫服務。Python風格的組態規範,便於在雲環境中部署。聯創加入輝達Lepton AI創始人賈揚清畢業於清華大學,之後在加州大學伯克利分校獲得博士學位。2013年,在伯克利讀博時,賈揚清用輝達捐贈的一塊K20 GPU,開發出深度學習框架Caffe。這個起初只是業餘時間做的項目,成了全球第一個通用深度學習框架。在導師鼓勵下,他將Caffe開源,很快就被微軟、雅虎、輝達、Adobe等公司採用。2019年,賈揚清加入阿里巴巴,擔任技術副總裁。他推動建設了巨量資料和AI平台,還主導了開源模型社區「魔搭」,實現了從AI框架專家到雲端運算業務領導者的轉變。2023年,賈揚清從阿里離職,創辦了Lepton AI。和賈揚清一起加入輝達的,還有Lepton AI的另一位聯合創始人白俊傑。白俊傑與賈揚清有著相似的職業經歷,他們都曾在Meta和阿里雲任職。在Meta擔任AI研究員期間,兩人共同參與了PyTorch框架的開發工作。後來,白俊傑在阿里雲擔任AI平台總監,帶領全端AI工程團隊攻克了諸多技術難題。輝達的「AI帝國」輝達,投資了一系列AI相關的公司,建構了龐大的AI帝國。其中包括以色列GPU創企Run:ai、以色列AI創企Deci、西雅圖AI創企 OctoAI,這些企業聚焦於降低開發或運行由輝達支援的AI模型的成本。輝達這次收購Lepton AI,有著很重要的戰略考慮。通過收購Lepton AI,輝達能讓客戶按需租用GPU資源,靈活擴展AI工作負載。Lepton AI在AI演算法、模型最佳化等方面的獨到之處,有望進一步提高計算效率。Lepton AI在一些細分市場裡,積累了一定的客戶基礎和管道資源,通過收購,輝達可以進入這些領域。輝達的雲服務和軟體業務尚處於起步階段,面臨著Google雲、微軟、AWS等科技巨頭的激烈競爭。三個月前,輝達公佈軟體、服務和支援業務的年化收入是15億美元,和之前預計的20億美元有差距。一方面,收購Lepton AI,輝達能進一步拓展自己在雲端運算市場的業務佈局,鞏固領先地位。另一方面,賈揚清和白俊傑等人才的加入,給輝達帶來了強大的技術研發力量。他們的豐富經驗和專業知識,有望助力輝達在AI模型開發工具、雲服務最佳化等方面,取得更多創新成果。據記者Marina Temkin(CFA持證人)統計,核心投資,投資至少1億美元:(資料截至2024年7月)OpenAI:2023年10月參與6.6億美元融資輪(估值1570億美元),出資1億美元xAI:數月後轉身投資馬斯克旗下60億美元融資的競品公司Inflection:2023年6月領投13億美元,後因創始團隊被微軟挖角估值縮水其他億美元俱樂部:Wayve(自動駕駛):2024年5月參與10.5億美元融資Scale AI(資料標註):2024年5月聯合投資10億美元(估值140億)Mistral AI(法國大模型):2024年6月6.4億美元B輪(估值60億)CoreWeave(雲端運算):2023年4月注資後估值從20億飆升至190億(最近成功IPO,估值230億美元)此外,輝達的戰略佈局既包括GPU生態,也包括了全球不同的產業應用。晶片生態:投資GPU雲服務商Lambda(4.8億D輪)、CoreWeave前沿技術:涵蓋光學互聯(Ayar Labs)、醫療AI(Hippocratic AI)、智慧型手機器人(Bright Machines)全球覆蓋:從日本Sakana AI到加拿大Cohere而近期,頻頻傳來AI資料中心過剩的消息。也許,被輝達收購是Lepton AI的最佳選擇。 (新智元)
輝達收購阿里前副總裁創辦的公司Lepton AI
4月8日消息,輝達完成了對GPU租賃商Lepton AI的收購交易。Lepton AI由阿里前副總裁賈揚清創立於2023年,團隊約20人。據悉此次收購耗資數億美元,Lepton AI的創始人賈揚清和白俊傑都已加入輝達。作為全球AI算力市場的"軍火商",輝達顯然不滿足於只做晶片供應商的角色,在雲端運算三巨頭AWS、Azure和GCP的圍堵下,黃仁勳正在下一盤更大的棋。通過收購Lepton AI這類"中間商"企業,輝達不僅能把控從晶片研發到雲服務落地的全產業鏈,更能在生成式AI應用爆發的清晨時分,直接收割那些需要靈活算力卻無力簽訂長期雲合同的中小企業使用者。這場看似低調的收購,背後暗藏著輝達建構AI帝國版圖的野心。當OpenAI等企業還在為高額算力帳單發愁時,輝達已悄然將業務拓展到眾多AI創業公司的伺服器機房。- 01 - Caffe之父創業Lepton AI創始人賈揚清是浙江紹興人,AI架構領域的傳奇人物。他本碩均畢業於清華大學自動化系,在加州大學伯克利分校攻讀電腦科學博士學位期間,開發出深度學習框架Caffe,該框架成為全球最受歡迎的開源深度學習框架之一。畢業後,賈揚清先後在新加坡國立大學、NEC美國實驗室以及Google Brain工作積累經驗。2019年3月,賈揚清加入阿里巴巴,擔任技術副總裁,同年9月還擔任阿里巴巴集團副總裁等重要職務。作別阿里4個月後,也就是2023年7月,這位“Caffe之父”與同樣出身阿里的技術大牛白俊傑(ONNX神經網路交換標準開創者)和李響(Kubernetes核心元件etcd創始人)組成“技術夢之隊”,新公司Letpon AI正式浮出水面。公司名稱源於物理學中的輕子(Lepton),寓意以輕盈之姿改變算力世界的底層邏輯。他們用500行程式碼打造的對話式搜尋引擎Lepton Search,打破了傳統AI開發的壁壘,將Google、Meta等巨頭的雲端經驗普及開來。(科普:Lepton Search是賈揚清團隊開發的開源對話式人工智慧(AI)搜尋引擎。它基於Transformer模型和知識圖譜,旨在通過自然語言互動理解使用者的真實意圖,提供智能化的搜尋體驗。)- 02 - 不生產GPU,但讓GPU更好使Lepton AI致力於為企業提供高效、可擴展的AI應用平台。因其採用的是雲原生的多雲解決方案,所以能賦能任何一家GPU提供商迅速升級。通俗的說,Lepton AI就像AI世界的“算力法師”,雖不直接擁有GPU硬體,卻通過雲端建構起一張覆蓋全球的計算網路。他們從AWS等雲廠商租用輝達晶片,併疊加自研的智能調度系統,成功助力遊戲公司Latitude.io的數十萬玩家流暢體驗AI角色互動,也幫助科研機構SciSpace從海量論文中精準抓取資料。其獨創的“多雲拼圖”模式,用統一API整合不同雲平台資源,使企業能以“每GPU小時多花幾分錢”的代價,獲得高性能專業級算力,直擊開發者等“買不起、管不好”的痛點。僅兩年時間,Lepton AI就被SemiAnalysis評為全球GPU雲服務黃金梯隊中“唯一未燒錢囤貨的玩家”。2023年5月,Lepton AI完成了1100萬美元天使輪融資,投資方包括矽谷知名風投CRV、紅杉中國和Fusion Fund。並且,這三家投資機構在不到兩年時間內就實現投資退出,獲得了可觀的財務回報。- 03 - 輝達為何重金收購Lepton AI其實簡單來說,Lepton AI的主要業務是出租由輝達AI晶片驅動的伺服器。在當前競爭激烈的AI算力市場中,輝達以數億美元收購Lepton AI,是其從“硬體霸主”向“全端服務商”戰略轉型的重要一步。如今,亞馬遜AWS、Google雲等雲服務巨頭紛紛自研AI晶片(如AWS Trainium、GoogleTPU),並推行低價租賃策略,輝達的GPU壟斷地位面臨“去輝達化”的威脅。而Lepton AI的“雲原生+多雲整合”技術,能夠以極低的成本調度全球GPU資源,其輕量化軟體工具鏈(如僅用500行程式碼打造的搜尋引擎)與輝達CUDA生態深度協同,有效彌補了輝達在雲服務與企業軟體市場的短板。通過將Lepton AI的技術團隊納入麾下,輝達得以建構“晶片+雲平台”的端到端解決方案,既抵禦雲巨頭的生態閉環衝擊,又能滲透中小型企業市場,推動其軟體業務收入向1500億美元的長期目標邁進。- 04 - 輝達近年來的併購佈局在戰略併購層面,輝達近年來在AI基礎設施領域頻繁佈局。2024年,輝達以7億美元收購叢集管理平台Run.ai,3億美元收購模型最佳化企業Deci,並先後納入推理加速工具OctoAI和合成資料公司Gretel。這些收購涵蓋AI開發全鏈條,目的是降低AI開發成本、鞏固算力基礎設施主導權。Run.ai最佳化GPU資源調度,Deci提升模型能效比,Gretel解決訓練資料瓶頸,共同形成從晶片到應用的閉環生態。目前,這些企業已深度整合至輝達AI Enterprise套件。例如,Run.ai的技術使GPU利用率提升40%,Deci的自動化壓縮演算法幫助客戶降低30%推理成本。這種“拼圖式併購”策略成效顯著,使得輝達在2024年雲與軟體業務收入突破15億美元,較三年前增長近5倍。- 05 - 全球AI雲服務市場的競爭格局與挑戰全球AI雲服務市場正以38%的年復合增速迅猛發展,預計2025年規模將突破2000億美元。當前,市場競爭呈現“三足鼎立”的格局。輝達憑藉硬體優勢與生態整合佔據主導地位,AWS、Google雲通過自研晶片與低價策略爭奪份額,阿里雲、華為雲則加速國產晶片(如昇騰910B)與開源生態建設。然而,近日一熱點問題是,中美關稅問題的日益激烈。若進一步升級,輝達或也即將面臨“軟硬一體”戰略的雙重打擊。具體來說:晶片出口限制可能削弱其硬體根基,資料主權博弈可能導致區域雲服務割據。例如,美國擬對資料中心裝置加征25%關稅,這將推高伺服器採購成本3%-5%,迫使企業轉向墨西哥或東南亞設廠。同時,地緣政治因素可能加速技術替代。中國推動昇騰晶片與MindSpore框架協同發展,歐盟推進Gaia-X主權雲建設,全球AI基礎設施可能分裂為美、中、歐三大技術陣營。這種碎片化不僅會抬高研發成本,還可能降低全球AI創新效率。對於中國而言,美國對華晶片出口限制若進一步收緊,短期內可能加劇中國企業的算力成本壓力,但長期來看將促使本土技術破天。天數智芯已實現國產GPU對DeepSeek模型的快速適配,DeepSeek等企業也開始探索低算力依賴模型,試圖突破硬體封鎖。加上政策扶持下的產業鏈協同(如《新一代人工智慧發展規劃》),或加速形成“去輝達化”的平行生態。這場全球範圍內的博弈不僅會重塑全球算力供應鏈,還可能導致技術標準分裂,使AI基礎設施市場從“性能競賽”轉向“生態割據”的新競爭階段。 (鉛筆道)
賈揚清創業2年,老黃砸重金收購!AI框架締造者或賣出數億美金
【新智元導讀】巨頭輝達,即將收購阿里前副總裁賈揚清的初創Lepton AI,交易價值或達數億美元!而Lepton AI,僅僅創立兩年。就在剛剛,國內AI圈被這一消息刷屏了。賈揚清成立兩年的AI初創公司Lepton AI,即將被輝達收購。據外媒The Information報導,輝達正在接近達成收購Lepton AI的協議,交易金額為數億美元。而Lepton AI的主要業務,就是專門出租由輝達AI晶片驅動的伺服器。根據賈揚清介紹,在SemiAnalysis評選的neolcould解決方案中,Lepton AI是唯一一個沒有重金採購GPU的公司。因為他們採用的是雲原生的多雲解決方案,能讓任何一家GPU提供商迅速升級。為什麼輝達選擇在此時重金收購Lepton AI?原因是,亞馬遜和Google這些老客戶步步緊逼,輝達被逼得實在沒有辦法了,不得不立刻轉型!老客戶背刺,輝達被迫轉型本來,亞馬遜和Google都是輝達的最大客戶,但現在,它們紛紛通過開發、低價租賃替代晶片,來降低對輝達的依賴。這樣導致的結果,就是輝達的收入大幅減少。而收購Lepton AI,是輝達進軍雲端運算和企業軟體市場戰略佈局的一部分,目的就是為了和亞馬遜、Google開戰。Lepton AI的總部位於加州,在租賃輝達GPU伺服器業務上,它和Together AI之類的初創公司是直接競品。注意,這些公司並不會自行管理資料中心或伺服器,而是先從雲服務提供商租用伺服器,再租給自己的客戶。這個業務,利潤空間就很大了。據悉,Together AI如今已經實現了超過1.5億美元的年化收入,換算一下,就是大概1250萬美元的月收入。這類企業,在業內被稱為「推理服務提供商」或「GPU轉售商」。另外,他們的業務除了硬體租賃,還包括開發自己的軟體平台,幫助其他初創公司或軟體企業這類客戶在雲環境中建構和管理自己的生成式AI應用。不過跟Together相比,Lepton AI的收入規模就沒有那麼大了。他們AI雲服務的主要客戶,有遊戲初創公司Latitude.io和科研初創公司SciSpace。前者使用使用Lepton AI來運行AI模型,支援一項月活使用者已達數十萬的服務。後者使用Lepton AI為學術論文搜尋引擎提供技術支援。總之外媒稱,跟Together、Firewoks這些競爭對手相比,Lepton AI在市場上的形象總體比較低調。被輝達高價收購的Letpon AI,是何背景?2023年7月,賈揚清離職阿里4個月後,新公司Letpon AI正式浮出水面。這是一家專注於人工智慧基礎設施的公司,總部位於美國加利福尼亞州Palo Alto。Lepton AI這個名稱源自物理學中的一種基本粒子——輕子。公司曾於23年5月成立之前,完成了首輪1100萬美元天使融資,由Fusion Fund、CRV領投。當時,賈揚清在回覆Pytorch之父評論中,曾提到還有兩位聯創與其一起創辦了新公司,分別是ONNX創始人以及etcd的創始人。此前,賈揚清最初在Google大腦擔任研究科學家,還參與建構了部分支援Kubernetes的軟體,Kubernetes是一個起源於Google的大規模雲應用程式管理工具。2016年,他加入Meta擔任AI研究員後,又與白俊傑一起參與了PyTorch的開發。Letpon AI的核心定位是,成為「AI時代雲服務提供商」,旨在建立高效的AI應用平台。其主要業務通過提供大模型推理引擎和雲GPU解決方案,幫助企業去快速部署AI應用。而且,他們還建立了多雲平台,整合全球GPU資源,讓使用者獲得極具性價最高計算資源。而且,團隊還開發了一款智能搜尋引擎Lepton Search,僅用500行Python程式碼建構,以輕量級、高效著稱。輝達之困:光靠賣GPU,已經不夠了為什麼輝達要收購Lepton AI?顯然,這是計畫的一部分。輝達,如今顯而易見正在建構全新的業務版圖。雖然它的雲端運算和軟體業務目前尚處於起步階段,但它已經開始向企業出租由自家晶片驅動的伺服器,同時還會提供軟體,幫企業開發AI模型和應用,以及管理用於訓練AI的GPU叢集。根據輝達的估計,這些業務未來有望創造高達1500億美元的收入。GTC大會上,老黃宣佈:輝達正在建構3個AI基礎設施——雲上AI基礎設施,企業AI基礎設施和機器人AI基礎設施不過有些微妙的是,在本月中最近一次季度財報電話會議上,輝達卻完全迴避了這一話題。三個月前,輝達靠軟體、服務和支援業務,已經實現了15億美元的年化收入(每月約1.25億美元),而輝達預計,這一數字將在2024年底前攀升至20億美元。而輝達的晶片業務,在截至1月26日的財季中創造的收入為356億美元。總之,雖然AI晶片仍然是輝達的核心收入來源,但顯然,軟體、服務和支援業務的增長潛力巨大,輝達已經下定決心,瓜分這一塊蛋糕。輝達2025財年第四季度財報顯示,公司發展一片大好,市場對AI晶片的需求依舊強勁輝達,大力發展工業客戶符合這一步調的是,輝達最近幾個月一直在大力宣傳自家的軟體產品。雖然過去幾年中,輝達大概一半的AI伺服器晶片,都是被雲服務提供商買走了,不過老黃表示——長期來看,輝達對其他類型企業的銷售額佔比,將遠遠大於對雲服務提供商的銷售額。他還暗示道,包括汽車製造商在內的工業企業,未來會直接購買AI晶片,而不是從雲服務商那裡租用。此前大家對AI晶片的批評,主要就集中在價格昂貴、需求旺盛,讓企業想擴展AI應用規模時,面臨成本上的巨大壓力。但最近,DeepSeek這種價格親民的強大模型,已經讓局面徹底改變了。而這幾年,輝達也在一刻不停地收購小型生成式AI和雲端運算初創公司,為的就是降低成本,讓開發者能輕鬆使用輝達晶片。過去一年,輝達就斥巨資收購了Run.ai和Deci,代價或許超過10億美元。而最近收購的則是OctoAI和Gretel。輝達一直在收購小型生成式AI和雲端運算初創公司,以降低成本並使開發者更容易使用其晶片運行AI模型GPU雲服務評級,賈揚清初創進第二梯隊SemiAnalysis最新文章中,發佈了世界上首個GPU雲服務評級系統ClusterMAX™。這個系統主要以普通使用者的角度對GPU進行評,共分為5個不同等級:白金、黃金、白銀、青銅和不及格。目前,他們已獨立測試了數十種GPU。白金代表著引領行業標準的GPU雲服務,目前也僅有一家CoreWeave達到這一等級。而在超大規模雲服務提供商中,Oracle的GPU租賃價格是最低的之一。評測結果還顯示,一些青銅提供商,已經在努力趕上如Google雲。Google雲也在快速發展,有望下次衝進黃金/白金。值得一提的是,Lepton AI這家僅成立2年的公司,成功進入第二梯隊(黃金)。Lepton AI,具體是幹什麼的Lepton AI本身不擁有GPU硬體,而是專注於提供一個ML平台軟體層,用於管理和最佳化GPU資源。不論是初創公司,還是個人開發者, Lepton AI宣稱皆能賦予專業級算力支援。他們提供了兩種靈活的使用方式,具體來說:· 租用GPU:Lepton AI會從其他供應商租用GPU,在疊加上自家軟體層,每GPU小時僅需額外之父幾分錢。· 自選GPU:從價格更優的Nebius租用GPU,然後單獨購買Lepton AI軟體和服務,同樣是每GPU小時幾分錢,即可享受完整的平台功能。他們將Google、Meta等科技巨頭在機器學習平台上的經驗「平民化」,讓普通使用者也能輕鬆上手。這種靈活性,能夠讓使用者根據預算和需求自行選擇。Lepton AI工程團隊憑藉著敏銳的產品洞察力,確保了平台高效性。針對訓練,他們提供了一種類似Slurm的作業提交方法。在SemiAnalysis測試中,將現有的sbatch指令碼正常運行在Lepton AI平台上,僅需幾分鐘的時間。而且,轉換到平台進行訓練的過程相當直觀。不過,Lepton AI提供的類似於Slurm sbatch功能,而非完整的 sbatch超集API。此外,Lepton AI的控制台儀表板,是其一大亮點。使用者可以輕鬆查看節點生命周期,即時監控每個節點當前的作業和狀態,可視化功能僅次於CoreWeave的節點生命周期儀表板。並且,Lepton AI推出的開源解決方案gpud,已經為大多數被動健康檢查項目提供了全面的支援。雖然這個被動GPU檢查系統仍在持續最佳化中,但已經算是非常強大的解決方案。此外,Lepton AI也會提供手動主動健康檢查功能,比如DCGM診斷和nccl-tests,但這些檢查需要通過UI儀表板手動運行,不像CoreWeave那樣能夠自動按周進行定期檢查。還不足的是,Lepton AI沒有提供NCCL測試的參考數值,也缺少Megatron Loss收斂主動健康檢查或Nvidia TinyMeg2靜默資料損壞(SDC)檢測器主動健康檢查。另外,Lepton AI還提供了一些測試版功能,比如一鍵式零影響NCCL分析器。只需點選一個複選框,就能充分利用其自主研發的內部NCCL分析器來可視化集體通訊瓶頸,這樣就能幫助客戶最佳化網路性能瓶頸。賈揚清:Caffe之父,AI框架締造者提到賈揚清,可以說是業內耳熟能詳的「框架大神」。作為主流AI框架Caffe創始人、TensorFlow的作者之一,PyTorch 1.0的共同締造者,他的貢獻早已深入AI開發的每個角落。賈揚清,浙江紹興人,本科和研究生階段都就讀於清華大學自動化專業。在研究生學習期間,他曾在新加坡國立大學、微軟亞洲研究院、NEC美國實驗室和Google研究院工作/實習,積累了豐富的實踐經驗。2008年,他赴往加州大學伯克利分校攻讀電腦科學博士,導師是Trevor Darrell教授。在博士期間,他創立並開放原始碼的深度學習框架Caffe。這個框架一經推出,因其高效性、易用性迅速走紅,被微軟、雅虎、輝達、Adobe等公司採用。畢業後,2013年,賈揚清正式加入Google大腦團隊,在Hinton和Jeff Dean等人的帶領下,參與了TensorFlow平台的開發 。此外,他還與同事一起建立了全新深度學習架構GoogLeNet——首個在圖像分類任務中,超越人類精準性的神經網路。3年後,賈揚清轉投Facebook(Meta),在Yann LeCun領導下擔任研究科學家,並在2017年,晉陞為AI架構總監。在此期間,賈揚清在AI架構的大道上一路進擊:· 2016年11月,Facebook推出輕量級模組化的深度學習框架Caffe2Go,讓手機也能運行深度神經網路模型。· 2017年4月,Facebook宣佈開源產品級深度學習框架Caffe2,帶來跨平台機器學習工具。· 2017年,建立了首個開放模型格式ONNX原型,後來被FB、微軟、亞馬遜等公司聯合推廣。2018年5月,Facebook正式公佈的PyTorch 1.0整合了ONNX格式。2019年3月18日,賈揚清加入阿里達摩院,擔任技術副總,負責巨量資料以及AI方向的技術、產品和業務。直到2023年3月,他官宣離職,並在幾個月之後創辦了Lepton AI。根據個人首頁,賈揚清被引數最高的三篇論文,TensorFlow和Caffe赫然在列,他的每一步都推動了深度學習工具普及與進化。曾有網友戲稱,學物理繞不開牛頓,搞深度學習,繞不開賈揚清。 (新智元)